Các ví dụ suy luận Bayes đơn giản Suy luận Bayes

Bánh quy từ hộp nào ?

Để minh họa, giả sử có hai hộp đựng đầy bánh quy. Hộp thứ nhất có 10 chiếc bánh quy sô-cô-la và 30 chiếc bánh quy bơ. Hộp thứ hai đựng mỗi loại bánh 20 chiếc. Bé Khoai chọn ngẫu nhiên một hộp, rồi nhặt đại một chiếc bánh. Ta có thể giả thiết rằng bé Khoai còn rất nhỏ nên không phân biệt hộp này hộp kia, và bé thích tất cả các loại bánh kẹo nên bánh loại nào với bé cũng vậy. Và chiếc bánh mà bé Khoai chọn té ra là một chiếc bánh quy bơ. Vậy khả năng Khoai nhặt chiếc bánh đó từ trong hộp thứ nhất là bao nhiêu?

Một cách trực quan, có vẻ rõ ràng là câu trả lời phải lớn hơn 1/2, do trong hộp 1 có nhiều bánh quy bơ hơn. Câu trả lời chính xác được tính theo định lý Bayes. Giả sử H1 tương ứng với hộp 1, và H2 tương ứng với hộp 2.Ta biết rằng đối với bé Khoai, hai hộp là như nhau, do đó, P(H1) = P(H2), và tổng của chúng phải bằng 1, do đó cả hai đều bằng 0,5.Dữ liệu D là quan sát về chiếc bánh quy bơ. Từ nội dung của hai hộp bánh, ta biết rằng P(D | H1) = 30/40 = 0,75 và P(D | H2) = 20/40 = 0,5. Khi đó, công thức Bayes cho ra kết quả:

P ( H 1 | D ) = P ( H 1 ) ⋅ P ( D | H 1 ) P ( H 1 ) ⋅ P ( D | H 1 ) + P ( H 2 ) ⋅ P ( D | H 2 )   = 0 , 5 × 0 , 75 0 , 5 × 0 , 75 + 0 , 5 × 0 , 5   = 0 , 6 {\displaystyle {\begin{matrix}P(H_{1}|D)&=&{\frac {P(H_{1})\cdot P(D|H_{1})}{P(H_{1})\cdot P(D|H_{1})+P(H_{2})\cdot P(D|H_{2})}}\\\\\ &=&{\frac {0,5\times 0,75}{0,5\times 0,75+0,5\times 0,5}}\\\\\ &=&0,6\end{matrix}}}

Trước khi quan sát thấy chiếc bánh mà bé Khoai nhặt, xác suất cho việc Khoai chọn hộp 1 là xác suất tiên nghiệm, P(H1), có giá trị 0,5.Sau khi đã nhìn thấy chiếc bánh, ta chỉnh lại xác suất đó thành P(H1|D), có giá trị 0,6.

Nên lưu ý là việc ta tin rằng việc quan sát thấy chiếc bánh quy bơ nên có ảnh hưởng theo cách nào đó tới xác suất tiên nghiệm P ( H 1 ) {\displaystyle P(H_{1})} đã tạo nên xác suất hậu nghiệm P ( H 1 | D ) {\displaystyle P(H_{1}|D)} , với giá trị tăng từ 0,5 lên 0,6. Điều này phản ánh trực giác của ta rằng chiếc bánh có khả năng được lấy từ hộp 1 hơn, do hộp này có tỉ lệ bánh quy bơ so với bánh quy sô-cô-la cao hơn hộp kia. Quyết định được cho dưới dạng một xác suất, điều này khác với thống kê cổ điển.

Kết quả dương tính sai trong một xét nghiệm y học

Ta thu được các kết quả dương tính sai khi một kiểm nghiệm cho ra kết quả dương tính một cách sai lầm. Ví dụ, một xét nghiệm y học cho một bệnh có thể trả về một kết quả dương tính với hàm ý rằng bệnh nhân có mắc căn bệnh đó ngay cả nếu bệnh nhân đó không hề mắc căn bệnh đó. Ta dùng định lý Bayes để tính xác suất mà một kết quả dương tính thực ra lại là một dương tính sai. Kết quả là nếu một căn bệnh hiếm gặp thì đa số các kết quả dương tính có thể là dương tính sai, ngay cả nếu xét nghiệm có độ chính xác cao.

Giả sử rằng một xét nghiệm cho một căn bệnh cho ra các kết quả sau:

  • Nếu người được xét nghiệm quả thực mắc bệnh đó, xét nghiệm trả về kết quả dương tính trong 99% các trường hợp, hoặc nói cách khác là với xác suất 0,99
  • Nếu người được xét nghiệm thực ra không có bệnh, xét nghiệm trả về kết quả âm tính trong 95% các trường hợp, hoặc nói cách khác là với xác suất 0,95

Giả sử rằng chỉ có 0,1% dân số mắc căn bệnh này, nghĩa là nếu chọn ngẫu nhiên một người thì việc người đó mắc bệnh có xác suất tiên nghiệm là 0,001.

Ta có thể dùng định lý Bayes để tính xác suất cho việc một kết quả xét nghiệm dương tính là một dương tính sai.

Giả sử A là tình huống người bệnh mắc căn bệnh đó, và B biểu diễn bằng chứng - một kết quả xét nghiệm dương tính. Khi đó, xác suất người bệnh thực sự mắc bệnh khi biết rằng kết quả xét nghiệm là dương tính là

P ( A | B ) = P ( B | A ) P ( A ) P ( B | A ) P ( A ) + P ( B | not  A ) P ( not  A ) P ( A | B ) = 0 , 99 × 0 , 001 0 , 99 × 0 , 001 + 0 , 05 × 0 , 999 ,   ≈ 0 , 019 . {\displaystyle {\begin{matrix}P(A|B)&=&{\frac {P(B|A)P(A)}{P(B|A)P(A)+P(B|{\mbox{not }}A)P({\mbox{not }}A)}}\\\\P(A|B)&=&{\frac {0,99\times 0,001}{0,99\times 0,001+0,05\times 0,999}}\,,\\~\\&\approx &0,019\,.\end{matrix}}}

và do đó, xác suất cho việc kết quả xét nghiệm dương tính là một dương tính sai là khoảng  (1 − 0,019) = 0,981.

Mặc dù xét nghiệm có độ chính xác cao, nhưng tỷ lệ dân số mắc bệnh lại thấp đến mức đại đa số người bệnh có kết quả xét nghiệm dương tính thực ra không mắc bệnh đó. Tuy nhiên, tỷ lệ giữa người có kết quả xét nghiệm dương tính thực sự mắc bệnh (0,019) cao gấp 19 lần tỷ lệ người dương tính nhưng lại chưa xét nghiệm (0,001). Do đó, xét nghiệm không phải vô dụng, và việc xét nghiệm lại có thể làm tăng độ tin cậy của kết quả.

Để giảm vấn đề dương tính sai, một xét nghiệm cần rất chính xác khi cho kết quả âm tính đối với người không có bệnh. Nếu xét nghiệm cho ra kết quả âm tính đối với người không có bệnh với xác suất 0,999, thì

P ( A | B ) = 0 , 99 × 0 , 001 0 , 99 × 0 , 001 + 0 , 001 × 0 , 999 ≈ 0 , 5 {\displaystyle P(A|B)={\frac {0,99\times 0,001}{0,99\times 0,001+0,001\times 0,999}}\approx 0,5} ,

khi đó, xác suất của một kết quả dương tính sai giờ là 1- 0,5 = 0,5.

Mặt khác, kết quả âm tính sai là khi một xét nghiệm đối với một người có bệnh nhưng lại cho ra kết quả âm tính. Ta cũng có thể dùng định lý Bayes để tính xác suất của một âm tính sai. Trong ví dụ trên,

P ( A | not  B ) = P ( not  B | A ) P ( A ) P ( not  B | A ) P ( A ) + P ( not  B | not  A ) P ( not  A ) P ( A | not  B ) = 0 , 01 × 0 , 001 0 , 01 × 0 , 001 + 0 , 95 × 0 , 999 ,   ≈ 0 , 0000105 . {\displaystyle {\begin{matrix}P(A|{\mbox{not }}B)&=&{\frac {P({\mbox{not }}B|A)P(A)}{P({\mbox{not }}B|A)P(A)+P({\mbox{not }}B|{\mbox{not }}A)P({\mbox{not }}A)}}\\\\P(A|{\mbox{not }}B)&=&{\frac {0,01\times 0,001}{0,01\times 0,001+0,95\times 0,999}}\,,\\~\\&\approx &0,0000105\,.\end{matrix}}}

Xác suất một kết quả âm tính là âm tính sai là khoảng 0,0000105 hay 0,00105%.

Khi một bệnh hiếm gặp, các âm tính sai sẽ không phải là một vấn đề lớn đối với xét nghiệm, do xác suất đó thấp. Nhưng nếu 60% dân số mắc bệnh, thì xác suất của một âm tính sai sẽ lớn hơn. Với xét nghiệm trên, xác suất của một âm tính sai sẽ là

P ( A | not  B ) = P ( not  B | A ) P ( A ) P ( not  B | A ) P ( A ) + P ( not  B | not  A ) P ( not  A ) P ( A | not  B ) = 0 , 01 × 0 , 6 0 , 01 × 0 , 6 + 0 , 95 × 0 , 4 ,   ≈ 0 , 0155 . {\displaystyle {\begin{matrix}P(A|{\mbox{not }}B)&=&{\frac {P({\mbox{not }}B|A)P(A)}{P({\mbox{not }}B|A)P(A)+P({\mbox{not }}B|{\mbox{not }}A)P({\mbox{not }}A)}}\\\\P(A|{\mbox{not }}B)&=&{\frac {0,01\times 0,6}{0,01\times 0,6+0,95\times 0,4}}\,,\\~\\&\approx &0,0155\,.\end{matrix}}}

Xác suất rằng kết quả xét nghiệm là một âm tính sai tăng lên mức 0,0155 hay 1,55%.

Trong phòng xử án

Trong một phiên tòa, một thành viên bồi thẩm đoàn có thể dùng suy luận Bayes để tính lũy các bằng chứng chống và bằng chứng bảo vệ bị cáo, và để xem tổng lại thì nó đã vượt qua ngưỡng của cá nhân vị bồi thẩm cho một nghi ngờ hay chưa.

Giả sử:

  • G {\displaystyle G} là biến cố rằng bị cáo có tội.
  • E {\displaystyle E} là biến cố rằng DNA của bị cáo khớp với DNA tìm được tại hiện trường vụ án.
  • P ( E | G ) {\displaystyle P(E|G)} là xác suất quan sát được biến cố E {\displaystyle E} với giả thuyết rằng bị cáo có tội. (Thông thường xác suất này được coi là bằng 1.)
  • P ( G | E ) {\displaystyle P(G|E)} là xác suất bị cáo có tội với giả thuyết rằng biến cố E {\displaystyle E} về chuyện DNA khớp xảy ra.
  • P ( G ) {\displaystyle P(G)} là ước lượng cá nhân của vị bồi thẩm về xác suất rằng bị cáo có tội, dựa trên các bằng chứng ngoài kết quả khớp DNA. Giá trị này có thể được dựa trên các phản ứng của bị cáo trong khi bị hỏi, hoặc dựa vào các bằng chứng đã được đưa ra trước đó.

Suy luận Bayes cho ta biết rằng nếu ta có thể gán một xác suất p(G) cho khả năng bị cáo có tội trước khi ta xét đến bằng chứng về DNA, thì ta có thể tính lại xác suất này theo xác suất có điều kiện P ( G | E ) {\displaystyle P(G|E)} , do

P ( G | E ) = P ( G ) P ( E | G ) P ( E ) {\displaystyle P(G|E)={\frac {P(G)P(E|G)}{P(E)}}}

Giả sử, dựa trên cơ sở gồm các bằng chứng khác, một vị bồi thẩm quyết định rằng khả năng bị cáo có tội là 30%. Cũng giả sử rằng bằng chứng pháp y là: xác suất một người được chọn ngẫu nhiên có DNA khớp với DNA tại hiện trường vụ án là một phần 1 triệu, hoặc 10−6.

Biến cố E có thể xuất hiện theo 2 cách. Hoặc là bị cáo có tội (với xác suất tiên nghiệm 0,3) và do đó DNA của chính anh ta có mặt tại hiện trường với xác suất 1. Hoặc anh ta vô tội (với xác suất tiên nghiệm 0,7) và anh ta không may đến mức là một trong số một phần triệu dân số có DNA trùng khớp.

Từ đó, vị bồi thẩm có thể tính lại quan điểm của mình để tính đến cả bằng chứng DNA theo cách sau:

P ( G | E ) = ( 0 , 3 × 1 , 0 ) / ( 0 , 3 × 1 , 0 + 0 , 7 × 10 − 6 ) = 0 , 99999766667 {\displaystyle P(G|E)=(0,3\times 1,0)/(0,3\times 1,0+0,7\times 10^{-6})=0,99999766667} .

Việc áp dụng suy luận Bayes có lợi ích là nó đã cho vị bồi thẩm một cơ chế hình thức cho việc kết hợp các bằng chứng được đưa ra. Cách tiếp cận này có thể được áp dụng một cách liên tiếp cho từng mẩu bằng chứng được trình trước tòa, với xác suất hậu nghiệm của bước này trở thành xác suất tiên nghiệm cho bước tiếp theo.

Nhưng vị bồi thẩm vẫn phải có một xác suất tiên nghiệm cho khả năng phạm tội trước khi bằng chứng đầu tiên được xét đến. Người ta khuyên rằng có thể lấy giá trị này bằng xác suất phạm tội của một người ngẫu nhiên thuộc giới tính tương ứng, lấy tại địa phương nơi xảy ra vụ án. Do đó, đối với một vụ án thực hiện bởi một người đàn ông trưởng thành trong một thành phố có 50.000 nam giới trưởng thành, xác suất tiên nghiệm khởi đầu có thể là 1/50.000.

Lý thuyết tìm kiếm

Tháng 5 năm 1968, Scorpion (SSN-589), tàu ngầm hạt nhân của Mỹ, đã không trở về cảng Norfolk, Virginia như mong đợi. Hải quân Mỹ tin rằng con tàu đã bị đắm ở vùng bờ biển phía Đông, nhưng một cuộc tìm kiếm rộng đã không tìm thấy xác con tàu. John Craven USN, chuyên gia nước sâu của Hải quân Mỹ, tin rằng xác tàu ở nơi khác và ông đã tổ chức một cuộc tìm kiếm ở phía Tây Nam Açores, dựa vào một phương pháp gây tranh cãi - phép đạc tam giác xấp xỉ bằng ống nghe dưới nước (approximate triangulation by hydrophones). Ông chỉ được cấp một con tàu, chiếc Mizar, và ông lấy lời khuyên từ một số chuyên viên tư vấn toán học để tận dụng tối đa các tài nguyên của mình. Một phương pháp tìm kiếm Bayes đã được sử dụng. Các chỉ huy tàu ngầm có kinh nghiệm đã được phỏng vấn để xây dựng các giả thuyết về cái gì có thể đã gây ra vụ đắm tàu Scorpion.

Vùng biển được chia thành lưới các ô vuông. Dưới mỗi một giả thuyết, mỗi ô được gán một xác suất. Kết quả là với mỗi giả thuyết có một lưới các xác suất. Các xác suất này được cộng lại với nhau để tạo một lưới xác suất toàn cục. Khi đó, xác suất gắn với mỗi ô sẽ là xác suất rằng vụ đắm tàu đã xảy ra tại ô đó. Một lưới thứ hai được xây dựng với các xác suất đại diện cho xác suất tìm thấy xác tàu nếu ô đó được tìm kiếm và xác tàu quả thực nằm tại ô đó. Đây là một hàm đã biết tính theo độ sâu của nước. Kết quả của việc kết hợp lưới này với lưới trước là một lưới cho ra xác suất tìm thấy xác tàu trong từng ô vuông của vùng biển nếu ô đó được tìm kiếm.

Lưới các ô trên vùng biển được tìm kiếm một cách hệ thống bắt đầu từ các vùng có xác suất cao nhất và tiến dần xuống các vùng có xác suất thấp hơn. Mỗi lầm một ô được tìm kiếm và không thấy xác tàu, xác suất của nó được tính lại theo Định lý Bayes. Điều này buộc xác suất của tất cả các ô khác phải được tính lại (tăng lên), cũng theo Định lý Bayes. Thời đó, việc sử dụng cách tiếp cận này đã là một thách thức lớn về mặt tính toán, nhưng cuối cùng nó đã thành công, và Scorpion đã được tìm thấy vào tháng 10 năm đó.

Giả sử một ô vuông có xác suất xác tàu nằm tại đó là p và xác suất tìm thấy xác tàu nếu nó nằm tại đó là q. Nếu ô đó được tìm và không thấy gì, thì theo định lý Bayes, xác suất được tính lại cho việc xác tàu nằm tại ô đó là

p ′ = p ( 1 − q ) ( 1 − p ) + p ( 1 − q ) . {\displaystyle p'={\frac {p(1-q)}{(1-p)+p(1-q)}}.}